ارائه‌ی الگوریتمی به‌منظور خوشه‌بندی صفحات وب براساس محتوا و لینک

نویسندگان

  • امیرمحسن کریمی‌مجد دانشکده‌ی مهندسی صنایع، دانشگاه علم و صنعت ایران
  • محمد فتحیان دانشکده‌ی مهندسی صنایع، دانشگاه علم و صنعت ایران
چکیده مقاله:

وجود یک موتور جست‌وجوی کارا می‌تواند سبب افزایش رضایت کاربران از خدمات تحت وب باشد. چالش اصلی موتورهای جست‌وجو، انتخاب مناسب‌ترین صفحات در مواجهه با پرسش‌های چندوجهی کاربران است. «خوشه‌بندی صفحات براساس محتوا و لینک» رویکردی است که برای حل چنین مسائلی در ادبیات پیشنهاد شده است. در این نوشتار، بر یکی از الگوریتم‌های موجود، به‌نام C‌o‌h‌s‌M‌i‌x، تمرکز شده و این الگوریتم برای ارتقای کیفیت پاسخ‌ها و افزایش سرعت حل بهبود داده شده است. تعیین نقطه‌ی شروع مناسب، استفاده از خواص شبکه‌های پیچیده به‌منظور ساده‌سازی محاسبات، و محاسبه‌ی مقدار واقعی انحراف استاندارد از جمله تغییرات پیشنهادی برای بهبود الگوریتم است. نتایج تجربی نشان می‌دهد که الگوریتم بهبودیافته، کیفیت جواب‌ها را ارتقا داده و باعث افزایش سرعت حل می‌شود. همچنین، به‌عنوان مطالعه‌ی موردی، داده‌های مربوط به وبلاگ‌های فارسی استخراج و الگوریتم بهبودیافته روی این داده‌ها اجرا خواهد شد.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

وب سنجیِ صفحات وب فارسی مرتبط با تغذیه براساس معیار سیلبرگ

Background and Aim: Considering the potential damages caused by inaccurate, inadequate and incomplete information published in web pages, the aim of this study was to evaluate Persian-language web pages containing nutritional information, using Silberg criteria. Materials and Methods: Internet pages related to nutrition were found in “peyvandha.ir” and by searching 20 nutrition-related keywo...

متن کامل

وب سنجیِ صفحات وب فارسی مرتبط با تغذیه براساس معیار سیلبرگ

زمینه و هدف: با توجه به صدمات بالقوه­ی ناشی از اطلاعات نادرست و ناکافی در صفحات وب، هدف این مطالعه، ارزیابی و تعیین وضعیت صفحات وب فارسی مرتبط با تغذیه براساس معیار سیلبرگ می­باشد. روش بررسی: صفحات وب مرتبط با تغذیه با استفاده از ۵ موتور جستجوگر و صفحه پیوندها، و با استفاده از ۲۰ کلیدواژه مرتبط با تغذیه پیدا شدند. 50 نتیجه اول جستجوی هر کلیدواژه در هر موتور جستجو در صورت مطابقت با معیارهای ورود...

متن کامل

ارزیابی سایتهای وب بازیابی شده توسط دو راهنمای شبکه وب (ODP و YAHOO) در حوزه علوم کتابداری و اطلاع‌رسانی براساس معیارهای محتوا و کارایی

در این پژوهش، ابتدا یک سیاهه وارسی جامع در دو دسته معیار کلی محتوا و کارایی شامل 42 شاخص در زیرگروههای صحت، اعتبار، جدید بودن، کیفیت نوشته، کاربرپسندی، قابلیت جستجو و قابلیت مرور، براساس سیاهه‌های وارسی در دسترس، تدوین گردیده  و سپس کیفیت محتوا و کارایی سایتهای وب بازیابی شده در حوزه علوم کتابداری و اطلاع‌رسانی در چهار مقوله بازیابی اطلاعات، مدیریت دانش، راهنماها و مراکز تحقیقاتی در دو ...

متن کامل

تکوین معیارهای زیبایی‌شناسی صفحات وب ایران

چکیده بررسی زیبایی در محیط تعاملی وب به‌معنای توجه به مخاطب به‌مثابه‌ی دریافت‌کننده‌ای منفعل نیست بلکه به معنی نیاز به روشی برخط است تا بتوان مخاطب را در فرایند طراحی وارد نمود. هدف از پژوهش، پیشنهاد روشی برای اخذ بازخورد مخاطب و تحلیل نتایج به‌منظور دست‌یافتن به معیارهای زیبایی‌شناسی مخاطب‌محور است. روش تحقیق، توصیفی-تحلیلی، همراه مطالعات کتابخانه‌ای، پژوهش میدانی و مصاحبه است. جهت تحلیل داده...

متن کامل

ارائه رویکردی به منظور شناسایی و پیش بینی وب‌سایتهای فیشینگ به وسیله الگوریتمهای کلاس‌بندی براساس مشخصه‌های صفحات وب

امروزه مهمترین ریسک و چالش مورد توجه در تجارت و بانکدارای الکترونیک، خطر کلاهبرداری آنلاین و حملات فیشینگ است. حملات فیشینگ همواره به عنوان یکی از ابزارهای پرکاربرد برای مهاجمان، به منظور سرقت کلمه­های عبور و رمزهای الکترونیک کاربران در مبادلات الکترونیک بوده است. در این نوع کلاهبرداری، مهاجمان نامه­های الکترونیک با ادعاهای مختلف به قربانی ارسال می­کند و با تکنیکهای مختلفی قربانی را به صفحه­های...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 33.1  شماره 1.1

صفحات  21- 28

تاریخ انتشار 2017-08-23

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023